Esse, of Something: 2025/03

2025/03/21

「人人都應該要有一台」的 DGX Spark

這波大語言模型的突破，帶來了很多新的應用的可能性，但許多的應用情境，可能出於隱私的需求，或是安全性的考慮，需要離線使用大模型。當然在資金充裕的情形下，直接拿訓練大模型的硬體來作為執行推論的區域網路伺服器，也是一種選擇，但這麼做的建置和維運成本都相當高。

基於這個「痛點」，目前多了很多新的選擇：例如新版的 Mac mini 就成為很多中小型實驗室建置大模型叢集的熱門選擇。而 AMD 新上市的 Strix Halo，也有很多廠商準備了 128GB 統合記憶體的產品要來攻略這個市場。

這兩天的 GTC 大會上，Jenson Huang 公佈了一項「人人都應該要有一台」的新產品，DGX Spark。個人覺得這完全就是衝著 Mac mini cluster 來的，一樣採用 ARM-based 處理器，更大的 128GB的統合記憶體，連定價區間都接近，但是由於是本家產品，直接支援 CUDA，所以大模型運作起來的效率就遠遠不是同一個等級。當然，由於硬體架構不同，在訓練模型的效率上沒辦法跟 H100/B100 系列相比，但作為微調（fine-tune）的工具還是游刃有餘，而其它廠牌產品受限於 CUDA 的支援，都只能做「推論」（就是執行人家訓練好的模型），要訓練或微調模型卻是沒辦法的。

所以，等上市就來買一台試試看囉。

2025/03/19

大語言模型與心理諮商

「大語言模型與心理諮商」應該算是我過去一年主要在忙的事情，雖然還沒有個正式的結果，但也可以先看看學術界的觀點。

兩篇參考文獻都是 2024 年刊登的，Omar 的那篇是回顧型文章，分析整理了16 篇 paper，所以應該不會太偏頗。

這件事清想當然爾的結論是「機會與風險並存」。機會嘛，我跟夥辦們正在努力的好好把握，而相關的風險也是要事先有所準備。以下摘錄幾句文章裡的金句：

Obradovich et al.: 大語言模型在「獲取資訊」、「凝鍊內容」上表現傑出，而且正在攻克需要繁複推理的問題。
Obradovich et al.: 一個說話生動流暢的夥伴，不但記得你生活中的每個細節，還隨時用溫暖的語氣給你支持，這可能會引發一種回饋循環：我們可能會更沉迷在人機互動，而代替了人與人的社交。
Omar et al.: 這些早期的研究揭示了大語言模型的多種應用，從診斷輔助到教育協助都有。鑑於認供智慧領域進步的速度，未來的研究會聚焦在探索「心理健康照護」當中的傳統角色，將會如何被新科技重新定義。
Omar et al.: 人們對大語言模型在臨床場景中的局限性和安全性的擔憂顯而易見……這表明，儘管 ChatGPT 很有前景，但將其整合到臨床精神病學中必須謹慎對待。

個人最擔心的是第二點，那是走向種族滅絕的道路；第四點則是老話一句：小心駛得萬年船。

Referece:

Obradovich et al. (2024): "Opportunities and risks of large language models in psychiatry" (Nature - Digital Psychiatry and Neuroscience)
Omar et al. (2024): "Applications of large language models in psychiatry: a systematic review" (Frontiers in Psychiatry)

2025/03/05

[摘譯] 未來歷史（A History of the Future）

原文：A History of the Future （part1, part2, part3）

作者：L Rudolf L

L Rudolf L 在另一系列三篇的《未來的歷史》（A History of the Future）當中，想像了從 2025 到 2040 這 15 年的發展，摘譯如下：

AI能力的進步：在2025年至2026年間，AI在程式碼生成（codegen）方面的能力顯著提升，使得創建應用程式的成本大幅降低。Google DeepMind 在數學模型和推理架構方面也取得了進展。Anthropic 則專注於 AI 安全和可解釋性研究。到2027年，OpenAI 發布了o7，具備更強的自主性和可靠性，能夠獨立完成許多辦公室工作。
經濟和就業市場的轉變：隨著AI程式碼生成能力的提升，軟體變得極為豐富，但價格也因此下降。許多非程式設計師也能夠創建B2B SaaS或從事自由程式設計。然而，由於AI能夠取代大量白領工作，導致就業市場出現結構性變化。到2030年代，辦公室工作轉變為監督AI系統，許多職位實際上成為閒職。
社會文化和政治的影響：文章預測，AI的發展將影響社會文化，例如，人們花費大量時間與AI互動，可能導致人際溝通能力下降。同時，AI也可能被用於操縱政治。在政治方面，美國和中國都將AI視為戰略重點，並加大對AI的投資和研發。
地緣政治格局的變化：文章認為，AI技術的競爭將加劇美國和中國之間的地緣政治競爭。到2030年代，美國和中國將在半導體和AI產業上實現自給自足。其他國家和地區，如歐盟和發展中國家，可能因AI的發展而面臨挑戰。
AI風險和安全：文章也關注AI可能帶來的風險，包括AI被用於網路攻擊、生物恐怖主義等。此外，隨著AI自主性的增強，如何確保AI的目標與人類價值觀一致，成為一個重要的研究方向。
機器人技術的崛起：到2030年代，機器人技術將得到廣泛應用，尤其是在製造業領域。美國和中國將大量部署機器人，以提高生產力和增強軍事力量。
人類的未來：在AI和機器人技術的影響下，人類社會將面臨深刻的變革。文章指出，到2040年，世界將變得極為富裕，但大部分資源將被用於地緣政治競爭和精英階層的地位競爭。普通人可能會發現自己越來越無力，只能眼睜睜地看著機器吞噬世界。

基本上，算是對前一篇文章，Capital, AGI, and human ambition，立論的詳細描繪。

話說回來，AGI 還沒來，想這些究竟算是高瞻遠矚，還是杞人憂天呢？